課程資訊
課程名稱
天文數據分析
Data Analysis in Astronomy 
開課學期
112-1 
授課對象
理學院  天文物理研究所  
授課教師
藍鼎文 
課號
AsPhys8025 
課程識別碼
244 D1200 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期二2,3,4(9:10~12:10) 
上課地點
天數812 
備註
總人數上限:20人 
 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

在過去二十年當中,伴隨著科技的進步,人類文明已邁進大數據時代,天文學研究亦是如此。觀測巡天計畫和大型物理模擬產生數以百萬比數據,供全世界所有人自由下載分析與探索。在此天文大數據時代,擁有能分析海量數據並從中萃取出全新的科學結果的能力,將是不可或缺。
此課程目標讓學生具備分析大數據的能力。我們將學習相關統計知識及各種數據分析的技術,包含機器學習,並將這些技術實際運用在天文數據當中。同時,我們將閱讀相關文獻並討論科學家是如何運用這些技術,以取得全新的科學結果。

請看最新版本
https://tingwenlan.notion.site/Data-Analysis-in-Astronomy-2023-Fall-d3845309d37f4f5d89224942a93427c0 

課程目標
透過本課程,學生可
1. 具備從事天文研究和數據科學工作所需的基礎統計知識。
2. 了解並運用數據分析的各種技術,包含誤差計算、相關性係數、回歸曲線、數據視覺化、數據降維分析、機器學習、神經網路等。
3. 擁有分析天文大數據的實作經驗。
4. 透過天文數據分析,學習最新的天文研究結果。
5. 判斷科學文獻中數據分析結果的可靠性。
6. 熟習並能應用科學方法及獨立思考推論,培養邏輯論述的能力。
上完這堂課,期學生能具備從事天文研究的基礎數據分析能力。 
課程要求
本課程將使用python,無python使用經驗可修習本課,然而擁有使用python經驗會較為容易上手。本課程第ㄧ週課程內容會包含基本的python使用。預期同學在課後花時間練習並熟悉相關的程式。
會在課程當中口頭英文報告並書寫成英文書面報告。
注:沒有有研究經驗或相關天文知識上起來會相對辛苦。

學生人數最多15人 (暫定)

上課會需要筆電 (如果自備筆電有困難的同學,請跟我聯絡) 
預期每週課後學習時數
 
Office Hours
另約時間 
指定閱讀
待補 
參考書目
Statistics, Data Mining, and Machine learning in Astronomy: A Practical Python Guide for Analysis of Survey data by by Željko Ivezić, Andrew Connolly, Jacob Vanderplas, and Alex Gray NTU library

Practical Statistics in Astronomy by C. R. Jenkins and J. V. Wall NTU library

Python Machine learning by Sebastian Raschka NTU library  
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
期中報告 
15% 
期中口頭報告 (15分鐘 10+5)+書面 (最多2 pages 不含圖) 
2. 
期末報告 
35% 
期末口頭報告 (20分鐘 15+5)+書面 (最多5 pages 不含圖) 
3. 
作業 
30% 
兩週一份作業(寫code練習和一些運用) 
4. 
口頭報告 
10% 
口頭報告論文或某一計畫 (15+5 mins) 
5. 
參與討論  
10% 
發言討論 例如在報告完給回饋 問問題 和討論論文時積極互動 [5%給回饋表單 5%問問題(同學報告) ] 
 
針對學生困難提供學生調整方式
 
上課形式
作業繳交方式
考試形式
其他
由師生雙方議定
課程進度
週次
日期
單元主題
第1週
9/05  1. Introduction of the course
2. The basic of Python, Jupyter Notebook, github, google colab
3. The importance of data visualization  
第2週
9/12  Theme: DATA! DATA! DATA! A lot of astronomical data are coming!

1. Research concepts / scientific method
2. Motivation of data analysis in astronomy
3. TOPCAT
4. A short introduction of astronomical surveys and simulations 
第3週
9/19  Theme: How can I tell the difference between two measurements? Detection or Noise

Basic statistics / uncertainty estimation / statistical estimators
 
第4週
9/26  Theme: What should I do if I see two parameter values increase together? How can I quantify this trend?


Error propagation / Correlation coefficients  
第5週
10/03  Theme: If the signals I am looking for are below the noise level, is it possible that I can still detect them?

Correlation coefficients / Cross-correlation measurements 
第6週
10/10  放假 
第7週
10/17  Theme: Finding a line going through all the data points! and describe the data.

Cross-correlation / Regression 
第8週
10/24  Midterm presentation / Regression  
第9週
10/31  Theme: What Machine learning can help us in extracting information from datasets?

Regression (continue) / The basic of machine learning  
第10週
11/07  Theme: What if I want to model the SED of quasars? Let us use the PCA technique

The basic of machine learning / PCA Dimensionality reduction techniques

 
第11週
11/14  Theme: What if I want to model the SED of quasars? Let us use the PCA technique


PCA Dimensionality reduction techniques  
第12週
11/21  Theme: With the photometric information, can we separate stars and quasars?

Support Vector Machine / Logistic regression / Decision tree / Random forest 
第13週
11/28  Theme: With the photometric information, can we separate stars and quasars?


Support Vector Machine / Logistic regression / Decision tree / Random forest

 
第14週
12/05  Theme: Deep learning technique (neural network) for classifying galaxy images.

Ethic of machine learning / Neural network / Deep learning 
第15週
12/12  Theme: Deep learning technique (CNN) for classifying galaxy images.


Neural network / Deep learning  
第16週
12/19  Final Presentation